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proc£d£ de clonage par digestion multiple, 
vecteurs pour sa mise en oeuvre et ses applications. 

La presente invention concerne le domaine de 
la biologie mol^culaire et se rapporte plus 
particuli&rement au clonage de g&nes. 

Le clonage de genes est un domaine en pleine 
expansion qui vise notamment a associer fonctions et 
genes, Ce domaine se d<§veloppe principalement selon deux 
grands axes, d'une part la biologie mol£culaire inverse, 
qui cpnsiste & sequence de fagon massive des banques 
d'ADN g6nomiques ou complementaires, et d' autre part la 
biologie mol6culaire directe, qui consiste a trouver la 
sequence responsable d'une activite observee, comme une 
activity enzymatique ou une homologie avec d'autres 
g£nes . 

La presente invention vise precisement a 
offrir une nouvelle methode de clonage d'un fragment 
d'acide nucleique, designee aussi ci-apres DMD pour 
"Digestion Multiple Dif ferentielle", qui repose sur 
1' utilisation systematique, combinee, et preparative des 
sites de restriction presents sur les inserts 
constituant une banque d'ADN complementaire ou 
g^ndmique . 

La DMD s' applique notamment aux cas du 
criblage de banques d' expression et du clonage par 
homologie . 

La pr&sente invention trouve egalement des 
applications dans le domaine fastidieux du sequengage 
quand celui-ci n'a qu'une activite d' identification des 
inserts, ainsi que dans 1' etude du polymorphisme humain, 
notamment dans le cadre de la recherche des 
predispositions genetiques. 



On designera ci-apres par Caracterist ique 
Enzymatique (CE) la resistance, notee "r" ou la 
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sensibilit6, not£e "s", d'un fragment d'acide nucl£ique 
a une enzyme de restriction. Ce qui signifie : 

- qu'un fragment qualifi6 "s" pour une 
enzyme de restriction donnee contient le site de clivage 

de cette enzyme, et 

- qu'un fragment qualifi6 "r" pour une 
enzyme de restriction ne contient pas le site de clivage 

de cette enzyme. 

La Caracteristique Enzymatique Multiple 
(CEM) est alors 1' ensemble des CE obtenues pour 
plusieurs enzymes. On peut alors repr£senter la CEM d'un 
fragment d'ADN contenant un site Eco, un site Bam, deux 
sites Sea, mais pas de site Hind ni Stu, de la fagon 
suivante : Eco s Banr , Sca°Hind" Stu" . 

Le procede de 1' invention propose done 
d'associer au fragment, que I'on cherche a isoler au 
sein d'un echantillon, sa caracteristique enzymatique 
multiple (CEM) . La recherche dudit fragment peut etre 
realisee par tout moyen connu de l'homme du metier, 
comme sa capacity a hybrider a une sonde nucleique, 
l'activite enzymatique de son produit proteique, 
1' expression d'une proteine que l'on pourra detecter, 
etc. . . 

Le procede de clonage selon 1' invention est 
fonde sur la demonstration que quand le nombre d' enzymes 
est suffisamment grand, chaque insert de la banque 
possede une CEM originale, et qu'en consequence, 
!• invention off re une strangle simple de clonage des 
genes a partir de leur CEM. Le procede selon 1' invention 
repose done sur le balayage de banques d'ADN en 
utilisant de fagon combinatoire la repartition des sites 
de restriction sur les inserts constituant cette banque. 



Le principe du procede selon 1' invention 
egalement sur 1 • utilisation d'un vecteur de type 
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nouveau car substantiellement d&pourvu de tous les sites 
de clivage par des enzymes de restrictions pour n'en 
garder que ceux n6cessaires a la construction de la 
banque, orient6e ou non, et k son <§ventuel sous-clonage 
dans un autre vecteur. Dans une forme particuli&re de 
realisation minimale, le vecteur contient : 

- un site A n£cessaire pour construire la 

banque , et 

- deux sites B, identiques et flanquant le 
site A, utile pour sous-cloner le g£ne une fois celui-ci 
identifie et clon&. 

Cet ensemble pourra etre d6sign£ ci-apr&s 
"trilinker" , dont la fabrication schematique est donnee 
a la figure 1 en annexe . 

Dans une autre forme particuliere de 
realisation, le vecteur contient : 

- un site A et un site A', differents, pour 
construire la banque, et 

deux sites B et B', identiques ou 
differents, et flanquant les sites A et A 1 , pour sous- 
cloner le g&ne une fois celui-ci identifie et clone. 

Avantageusement les sites B sont des sites 
octonucl6otidiques, de fagon a minimiser le risque que 
des sites B soient presents dans les inserts clones. II 
sera ainsi possible de sous-cloner facilement en un seul 
morceau . 

Environ 100 enzymes de restriction a site 
hexanucleotidique ont £te decouvertes a ce jour. 70 
d'entre-elles ont un site de reconnaissance de type 
palyndrome continu ou discontinu. 

Un vecteur de l 1 invention, avantageusement 
un plasmide, ne contient plus, mis £ part ces trois 
sites, de sites de restriction hexa ou penta- 
nucleotidiques correspondant a des enzymes de 
restriction dejci identifiees ou qui le seront dans . le 
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futur. On entend done par "substantiellement" , que cette 
destruction peut etre partielle en ce sens qu ! elle ne 
concerne que certains des sites connus; seules les 
enzymes correpondantes seront alors utilisees dans le 
procede de 1' invention. Dans 1' expose de 1' invention qui 
suit, on consid&re, comme indiqu6 precedemment que 
environ 50 & 70 types de sites ont <§te d^truits. 

Un vecteur de l 1 invention peut etre 
construit £ partir d'un plasmide deja existant et 
poss6dant toutes les fonctions necessaires pour 
permettre d'y cr£er et d'y manipuler une banque d'ADNC 
ou genomique. II peut etre utile, dans le procede de 
1' invention, que la banque ne contienne plus de vecteur 
seul referral sur lui-rnfime. II est done avantageux que le 
vecteur de 1' invention contienne un systeme qui elimine 
tout vecteur seul referme sur lui-meme, comme un g&ne 
suicide, un systeme de disruption de la proximity d'un 
promoteur lambda ou tout autre systeme connu de 1 1 homme 
du metier. 

La technique utilisee, dans le cadre de 
1 ! invention pour detruire tous les sites de restriction 
est une des techniques de mutagenese dirigee simple ou 
multiple deja decrites dans l ! art anterieur, ou tout 
autre technique connue par 1' homme du metier, comme le 
remplacement de segments du plasmide par 
oligonucleotides. On obtient ainsi un vecteur resistant 
a 70 enzymes de restriction, numerotees de I a LXX, et 
sensible k 2, designees ci-avant A et B. L'idee de 
detruire simultanement la majorite des sites de 
restriction presents sur un plasmide a ete envisagee par 
D. H. Jones et al . (BioTechniques 1994, 16, 4 : 694) 
mais dans un contexte tout different. En effet, cet 
article decrit la destruction par mutagenese multiple de 
31 des 37 sites d'un tires petit vecteur, de fagon a 
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crSer un nouvel outil facilitant certaines manipulation 
de l'ADN. 

Le procede de 1' invention est par ailleurs 
bas£ sur la creation d'une banque d 1 ADN, laquelle selon 
l f application envisagee contient de 1 k 10 8 et de 
pr6f£rence de 1 ' ordre de 10 5 £ 4. 10 6 fragments 
diffSrents de 1 ' ordre de 0,1 kb ^ 5 kb chacun, et de 
preference, selon les applications du procSdS de 
l 1 invention, de 1 a 2 kb. Dans le mode particulier de 
mise en oeuvre du procede de l f invention dScrit a 
l'exemple 6 ci-apres concernant 1' etude du 
polymorphisme, la banque peut ne comprendre qu ! un seul 
fragment . 

Ainsi, pour 1 1 application du procede de 
1' invention & la fabrication de banques d 1 expression ou 
au clonage par homologie, il a ete prepare, comme 
represents schematiquement & la figure 2 en annexe, une 
banque d'ADNc de 10 5 fragments differents de 1 kb 
chacun . 

Toutefois, ce modele constitue une 
approximation et est done legerement faux, car la taille 
des fragments est heterogene. La taille moyenne des 
inserts etant sous-estimee et la taille de la banque 
etant surestimee, ce modele a fetfe choisi afin de 
disposer d'une base simple (homogeneity de la taille des 
fragments) et d'un systeme d' etude qui desavantage 
1' analyse (taille de la banque surestimee, taille des 
fragments sous-estimee) de facon a ce que le procede de 
1' invention soit reproductible dans tous les cas . 

Pour 1 ' application du procede de 1' invention 
au Southern Blot d ' identification et a 1' etude du 
polymorphisme, il a 6te prepare, comme represents 
schematiquement a la figure 3 en annexe, une banque 
d'ADN genomique de 4.10 6 fragments differents de lkb 
chacun. Cette banque a ete obtenue par 1' utilisation 
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d'une enzyme correspondant & un site de frequence 
th^orique 1/1024 (de type AT(ACGT) (TGCA)TA) . 

Tous types de banques d'ADN, tels que celles 
obtenus par amplification au hasard par PCR utilisant 
des oligonucleotides d£g£neres ou non, entrent dans le 
cadre de la presente invention. 

En consequence, l 1 invention a pour objet un 
procede de clonage d'un fragment d'acide nucleique 
comprenant les 6tape suivantes 

- on prepare une banque d'ADN susceptible de 
contenir ledit fragment, 

- on crible ladite banque en utilisant de 
fagon combinatoire au moins 10 et de preference 50 a 70 
enzymes de restriction, pour isoler par tout moyen 
approprie le clone contenant ledit fragment. 

Dans ce proc£de, la preparation de la banque 
d'ADN susceptible de contenir le fragment d'acide 
nucleique, consiste a inserer chacun des fragments d'ADN 
d'un echantillon dans un vecteur depourvu de tout site 
de clivage par des enzymes de restriction k 

1' except ion : 

- d ! un site pour la construction de la 

banque, et 

£ventuellement de deux autres sites 
identiques, differents du premier ou des premiers 
site(s) et le(s) flanquant, utiles pour sous-cloner la 
sequence d'acide nucleique une fois celle-ci identifiee 
et clonee. 

Dans une autre forme de realisation de ce 
procede, on insure chacun des fragments d'ADN d'un 
echantillon dans un vecteur substantiellement depourvu 
de tout site de clivage par des enzymes de restriction a 

1' exception : 

- de deux sites pour la construction de la 

banque, orientee, et 
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6ventuellement de deux autres sites 
identiques ou non, diff£rents des deux premiers sites et 
le(s) flanquant, utiles pour sous-cloner la sequence 
d'acide nucl£ique une fois celle-ci identifiee et 
clon6e . 

Le proc6d£ comprend plus particulierement 

les etapes suivantes : 

a) on prepare une banque d'ADN susceptible 
de contenir ledit fragment d'acide nucleique, consistant 
£ insurer chacun des fragments d'ADN d'un echantillon 
dans un vecteur substantiellement d&pourvu de tout site 
de clivage par des enzymes de restriction mais 
conservant : 

- un ou deux sites pour la construction de 

la banque, et 

- eventuellement au moins deux autres sites, 
et de pr£f£rence seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flanquant, utiles pour sous-cloner le fragment d'acide 
nucl6ique une fois celui-ci identifie et clone. 

L' echantillon a partir duquel sont issus les 
fragments constituant la banque peut etre toute cellule 
eucaryote (mammifere, plante, levure, etc.), ou tout 
organisme procaryote (virus, bacterie, etc...). II peut 
s'agir d 1 ADN g&nomique, d'ADNc, de fragments 
d' amplification par PCR ou de tout autre banque d'ADN 
susceptible d'etre preparee par l'homme du metier. 

b) On realise la digestion en parallele de 
la banque par plusieurs enzymes de restriction, au moins 
10 et de preference environ 50 a 70 enzymes de 
restriction de fagon a obtenir autant de banques mono- 
digeres que d' enzymes utilisees. 

c) On transfecte independamment les banques 
mono-digerees dans des hotes cellulaires appropries de 
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fagon & obtenir des lots correspondant d'hotes 
cellulaires. 

d) On teste par tout moyen approprie chacun 
des lots obtenus k l'etape (c) pour ^valuer I'integrite 
de la sequence d'acide nucldque £ doner et ainsi 

etablir sa CEM. 

En effet, si la digestion par une enzyme 

d£sign£e "I" n' altere pas l'intfegrite de 1' insert 

r 

present dans la banque, celui-ci est considere I , au 
contraire, si elle 1' altere, celui-ci est consid6r6 I s . 

Les stapes (a) A (d) ci-dessus permettent 
I 1 analyse du fragment a doner selon 1' invention. 

Le procede de 1' invention comprend en outre 
les etapes suivantes permettant de purifier le fragment 
a doner : 

e) On reprend la banque totale de l'etape 
(a) et on la digere sensiblement simultanement par les 
enzymes qui n'affectent pas I'integrite du fragment £ 
doner. Pour lesquelles il a done ete considere "r" . 

f) On isole le clone resistant contenant le 
fragment d'acide nucleique a doner par tout moyen 
approprie et eventuellement on le sous-clone en 
utilisant les deux sites menages dans le vecteur a cet 
ef fet . 

g) On sequence eventuellement le fragment 
d ! acide nucleique a doner. 

La digestion multiple de l'etape (e) a pour 
effet de cliver la totalite, ou la quasi-totalite, des 
fragments d'ADN const ituant la banque, a 1' exception du 
fragment a doner. 

L'isolement du clone resistant contenant le 
fragment d'acide nucleique a doner de l'etape (f) peut 
etre realise par transformation de la banque multi- 
digeree dans des bacteries competentes, ou par PCR en 
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utilisant des oligonucleotides amorces flanquant le site 
de clonage de la banque. 

Eventuellement, par securite on peut 
effectuer des Stapes de verification entre les etape (a) 
et (b) d'une part, et (e) et (f) d' autre part 
consistant : 

a 1 ) A verifier la presence du fragment 
d'acide nucleique a doner dans la banque en 
transfectant dans un note cellulaire qui n'a pas ledit 
fragment et en testant par tout moyen ' approprie la 
presence du fragment dans ledit note. Avantageusement , 
on utilise dans cette etape (a 1 ) des cellules COS, 
classiquement mise en oeuvre pour les trans f ections . 

e 1 ) A transformer la banque mult i-dig£ree de 
l 1 etape (e) dans des notes competent s de fagon a 
verifier la nature des fragments clones. Par exemple, 
cette etape consiste a etaler sur petri et verifier par 
minipreparations d 1 ADN plasmidique (miniprep) que les 
inserts sont bien sensibles aux enzymes notees "s" lors 
de 1' etablissement de la CEM. 

Avantageusement, la banque d 1 ADN prepare a 
l 1 etape (a) contient de 1 a 10 8 et de preference de 
l'ordre de 10 5 4 4.10 6 fragments differents de 1 1 ordre 
de 0,1 kb k 5 kb chacun, et de preference de l'ordre de 
1 h 2 kb. 

Dans le procede de l 1 invention, on prefere 
que les deux sites de sous-clonage soient des sites 
octonucieotidiques, de fagon a minimiser le risque que 
des sites B soient presents dans les inserts clones. 

Dans un mode de realisation tout particulier 
du procede de l 1 invention, la banque ne contient plus de 
vecteur seul referme sur lui-meme. II est done 
avantageux que le vecteur de 1' invention contienne un 
systeme qui elimine tout vecteur seul referme sur lui- 
meme', comme un gene suicide, un systeme de disruption de 
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la proximity d'un promoteur lambda ou tout autre syst^me 
connu de l'homme du metier. 

Les tests realises aux etapes (d) et (a 1 ) 
pour verifier l'integrite de la sequence d'acide 
nucldque & doner peuvent etre tout moyen de mise en 
Evidence soit de la sequence elle-meme, comme une sonde, 
soit de la prot£ine codee par ladite s6quence, tel qu'un 
ligand comme un anticorps, ou encore de l'activite de 
cette prot6ine, comme un marqueur enzymatique, qui 
peuvent etre d6tectees par tout moyen connu de l'homme 
du metier, comme un marquage fluorescent ou radioactif . 

Les applications du proced6 de clonage selon 
1 ! invention sont tres nombreux et l ! on peut citer 
notamment celles detaillees dans les exemples ci-apr£s : 
Le clonage d'un gene par banque 

d* expression . 

- Le clonage par homologie. 

- Le Southern Blot d' identification denomm£ 
par I'Inventeur "identiblot" . 

- L 1 etude du polymorphisme . 

Aussi, on d^signera indif feremment dans ce 
qui suit par gene ou insert ou sequence, le fragment 
d'acide nucleique a doner selon le proced& de 
1 ! invention d&crit ci-dessus. 

Un procede de clonage d'un gene par banque 
d f expression selon 1 ! invention comprend les Stapes 
suivantes : 

a) On prepare une banque d'ADNc susceptible 
de contenir ledit gene en inserant ladite banque dans un 
vecteur substantiellement depourvu de tout site de 
clivage par des enzymes de restriction mais conservant : 

- un ou deux sites pour la construction de 
la banque, et 
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- eventuellement au moins deux autres sites, 
et de preference seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le 
flanquant, utiles pour sous-cloner le gene une fois 
celui-ci identifie et clone. 

b) On v£rifie la presence du gene recherche 
dans la banque en transfectant dans une lignee 
cellulaire qui n' a pas l'activite ou le phenotype 
recherche et en mesurant sa restaur at ion par une 
technique permettant de distinguer les cellules 
transfectees des cellules non transfect£es, par exemple 
par test cytom£trique ou enzymatique. 

c) On dig6re la banque ind&pendamment par au 
moins 10 et de preference environ 50 a 70 enzymes de 
restriction, 

d) On transfecte independamment les banques 
mono-digerees de l'etape (c) . 

e) On teste par tout moyen approprie chacun 
des lots obtenus A l'etape (d) pour la presence de 
l'activite associ&e au gene a doner et on evalue 
l'integrite de la sequence dudit gene afin d'etablir la 
CEM de l'activite associee audit gene. 

On entend par activite associee au gene la 
detection par tout moyen de la proteine codee par ledit 
g£ne ou de l'activite de cette proteine quelle qu'elle 
soit (ligand, enzyme, induction de tumeur, etc...). 

f) On reprend la banque totale de l'etape 
(a) et on la dig£re sensiblement simultanement par les 
environ 50 & 55 enzymes qui, en moyenne, n'affectent pas 
l'activite mesur^e a l'etape (e) . En consequence, 
statistiquement, tous les fragments constituant la 
banque seront clives, a 1' exception du fragment 
recherche . 

g) On transforme la banque mult i-digeree 
dans des bacteries competentes. En consequence, seuls 
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les vecteurs contenant un fragment non cliv& seront 
transformes dans les bacteries comp£tentes. 

h) On sous-clone en utilisant la ou les 
enzymes correspondant au(x) site(s) de sous-clonage 
m6nag<Ms) dans le vecteur, puis £ventuellement on 
sequence le g&ne. 

L 1 invention concerne egalement, les banques 
mono- ou multi-digerees obtenues dans le procede de 
1' invention et notamment aux etapes (c) et (f) des 
proc£d6s ci-dessus, ainsi que les supports, tels que des 
tubes, des membranes, des plaques, des gels, etc... qui 
peuvent contenir lesdites banques, leur produit 

d 1 expression ou des notes les contenant. 

L' invention se rapporte aussi aux notes 
cellulaires ou bacteriens contenant les banques ci- 
dessus . 

Un procede de clonage par homologie selon 
1' invention comprend les etapes suivantes : 

a) On prepare une banque d'ADNc comme deer it 
a l'6tape (a) pr£cedente. 

b) On digere la banque independamment par 
chacune d'au moins 10 et de preference environ 70 
enzymes de restriction. 

c) On transforme les produits de la 
digestion de l'etape (b) dans des bacteries competentes . 

d) On fait pousser les bacteries 
transformees en milieu selectif, de fagon a produire des 
banques digerees debarrassees des produits clives. 

e) On clive separement chacune de ces 
banques par la ou les enzymes correspondant au(x) 
site(s) de sous-clonage menage (s) dans le vecteur et 
l'on depose separement chacun de ces produits de 
digestion dans un puits de gel d' agarose ou 
d' acrylamide . 
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f) On fait migrer les produits de digestion 
de l'&tape (e) , puis l ! on transf£re sur membrane par 
exempie de nitro-cellulose, et i'on hybride avec une 
sonde sp§cifique du g&ne & doner par homologie, ou bien 
l'on depose directement les produits de I'etape (d) sur 
une membrane de nitrocellulose. 

g) On analyse la CEM du signal. 

e) On fait les multi-digestions 
correspondantes, de fagon a ce que le seul clone 
resistant soit le vecteur portant le g£ne a doner. 

Le proced6 de clonage par homologie ci- 
dessus peut etre applique a 1 1 identification : 

a) d' alleles de difftrentes souches 
d' animaux de la meme esp£ce, ou de differents individus 
chez l'homme (souvent tr£s homologues) . 

b) d' equivalents geniques presents chez 
diff^rentes especes (moderement homologues) . 

c) d'£pissages alternatifs d' un meme gene au 
sein d'un meme tissu ou entre differents tissus 
(homologie totale par sections) . 

d) de differents membres d'une famille 
g£nique, distribute au sein d'un meme tissus ou dans 
differents tissus. (homologie imprevisible, souvent tres 
forte dans certains domaines) . 

La version simplifiee de ce proc&de consiste 
£ effectuer des dots au lieu de Blots, c'est-a-dire a 
s'abstenir de cliver les banques mono-digerees par 
1' enzyme correspondant au site de sous-clonage menage 
dans le vecteur, et de les deposer directement en un 
point sur une membrane de nitro-cellulose . 

Un proc&de de Southern Blot d' identification 
d' inserts selon 1' invention permet d' identifier un 
fragment d'ADN sans avoir a le sequencer meme 
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partiellement • Ce proc6d§ comprend les etapes 
suivantes : 

(a) on prepare une banque d'ADN susceptible 
de contenir ledit insert, consistant £ insurer chacun 
des fragments d'ADN d'un 6chantillon dans un vecteur 
substantiellement depourvu de tout site de clivage par 
des enzymes de restriction mais conservant : 

- un ou deux sites pour la construction de 

la banque, et 

- eventuellement au moins deux autres sites, 
et de preference seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flariquant, utiles pour sous-cloner 1' insert une fois 
celui-ci identifie et clone. 

b) On digere cette banque par chacune d ! au 
moins 10 et de preference environ 50 a 70 enzymes de 
restriction . 

c) On transforme les banques monodigeres 
obtenues & I'etape (b) ci-dessus dans des bact^ries 
competentes, ou des hotes equivalents. 

d) On fait pousser les bacteries en milieu 
selectif, de fagon a produire des banques monodigerees 
debarass^es des produits clives. 

e) On clive separement chacune de ces 
banques par 1 ! enzyme correspondant aux deux autres sites 
identiques et different du premier ou des premiers 
site(s) et le(s) flanquant, et on depose les produits de 
digestion dans les puits d'un gel d' agarose ou 
d' acrylamide . 

f) On fait migrer ce gel et on le transfere 
sur une membrane par exemple de nitrocellulose. 

g) On utilise les inserts a identifier comme 
sondes marquees, soit un par un, soit plusieurs par 
plusieurs . 

h) On teste par tout moyen approprie chacun 
des lots obtenus a l'etape (g) pour associer les inserts 
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& identifier a une CEM. Cette CEM correspond £ 1' action 
des enzymes de l'6tape (b) . 

Un proced& d 1 etude du polymorphisme selon 
1' invention est identique au procede de Southern Blot 
d' identification d' inserts mais est caracterise en ce ce 
que : 

- La banque d'ADN genomique de l'£tape (a) 
est issue du sujet 6tudie, par exemple d'un malade, ou 
de sujets de la famille du malade. 

- Les inserts utilises comme sondes sont des 
marqueurs de polymorphisme deja decrits. 

Le procede d 1 etude du polymorphisme selon 
l 1 invention trouve son application soit dans le cadre de 
la recherche de marqueurs du polymorphisme associes a 
une pathologie, soit dans le cadre d'un diagnostic de 
cette pathologie. 

Une variante du procede de clonage precedent 
pour l'6tude du polymorphisme d'un individu comprend les 
etapes suivantes : 

a) On definit la CEM de chacun des marqueurs 
connus de fagon a permettre leur identification. 

b) On constitue une banque d'ADN genomique 
du sujet etudie consistant a insurer chacun des 
fragments d'ADN d'un echantillon dans un vecteur 
substantiellement d^pourvu de tout site de clivage par 
des enzymes de restriction mais conservant : 

- un ou deux sites pour la construction de 

la banque, et 

- eventuellement au moins deux autres sites, 
et de preference seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flanquant, utiles pour sous-cloner 1' insert une fois 
celui-ci identifie et clone. 
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c) On effectue la digestion de la banque par 
des batteries d' enzymes correspondant aux CEM attributes 
aux marqueurs etudi£s. 

d) On transforme les banques multidig6r£es 
dans des bact£ries compttentes. 

e) On cultive ces bact£ries en milieu 
liquide ou solide contenant 1' agent selectif du 
plasmide. Si 1' allele recherche existe, les bacteries 
poussent, par contre, si cet allele n' existe pas, elles 
ne poussent pas, et l'on dispose ainsi d'un profil pour 
chaque allele, 

Avantageusement, a l'etape (b) , on prepare 
une banque dont les fragments ont une longueur moyenne 
de 1000 a 4000 et de preference de 2000 nucleotides. 

Un mode de realisation de la variante ci- 
dessus permet egalement la detection des nombreux 
alleles de segments polymorphes, comme par exemple la 
gpl20 des virus HIV ou la p53 d' oncogenes cellulaires, 
dans le cadre de travaux de recherche ou d'un 
diagnostic. Le segment concerne est avantageusement 
amplifi6 par PCR et clone dans le plasmide, puis le 
procede est identique a celui decrit precedemment et 
expose en detail dans 1' exemple 6 ci-apres. 

L ? invention a aussi pour objet un melange 

d f au moins 10 et de preference de 50 a 70 enzymes de 

restriction susceptible d'etre utilise dans un procede 
selon 1 ' invention . 

L' invention concerne encore 1 ' utilisation 

d'un vecteur substant iellement depourvu de tout site de 

clivage par des enzymes de restriction mais conservant : 

- un ou deux sites pour la construction 
d'une banque, et 
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- 6ventuellement au moins deux autres sites, 
et de preference seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flanquant, utiles pour sous-cloner des fragments dans 

ladite banque, 

pour cribler une banque d'ADN. 

L 1 invention a done aussi pour objet une 
banque d'acide nucieique clonee dans un vecteur, 
susceptible d'etre preparee dans un proc£de decrit 
pr<§cedemment, caracteris£ en ce que ledit vecteur est 
substantiellement d£pourvu de tout site de clivage par 
des enzymes de restriction mais conserve : 

- un ou deux sites pour la construction de 

la banque, et 

- eventuellement au moins deux autres sites, 
et de preference seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flanquant, utiles pour sous-cloner les fragments de la 
banque . 

Avantageusement, ledit vecteur porte un 
systeme qui elimine tout vecteur seul referm& sur lui- 
meme. 

L 1 invention se rapporte aussi a : 

- une banque d'ADN multi-digeree par un 
melange d' enzymes decrit precedemment, 

- groupe de banques d'ADN ou chaque banque 
est mono-digeree independamment par chacune des enzyme 
du melange d f enzymes decrit precedemment, 

ainsi qu'aux h6tes cellulaires ou bacteriens 
ou les supports contenant une banque ou un groupe de 
banques ci-dessus. 

D' autres avantages et caracterist iques du 
procede de 1' invention apparaltront dans la description 
qui suit se rapportant a des exemples detailles de mise 
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en oeuvre du procede de l 1 invention dans diverses 
applications qui ne sauraient etre considers comme une 
limitation quelconque de l 1 invention. 

EagfflEle 2 ; L a preparation et 1 ' exploitation 
ri'nne ban gne d 1 expression . 

Une premiere application du procede de 
l 1 invention se rapporte a la preparation et k 
1 'exploitation d'une banque d 1 expression . 

Cette technique suscite depuis le milieu des 
ann£es 1980 un grand int^ret . De nombreux genes, comme 
ceux codant pour des recepteurs aux cytokines, des 
marqueurs de surface des lymphocytes, des proteines 
liant l'ADN, etc... ont £te identifies par cette 
technique (U. Gubler et al., Annals of the N. Y. Academy 
of Science 795 : 36-40, 1996 ; D. Pennica et al . PNAS 
92(4) : 1142, 1995 ; R. M. O'Brien et al . , Biochemical 
Journal 312 : 17 - 21, 1995) . Toutefois, les techniques 
de clonage par banque d' expression sont tou jours 
fastidieuses et dif f icilement reproduct ibles a ce jour. 

Les applications actuelles des banques 
d' expression concernent 1 1 identification du gene codant 
pour une proteine, dont les moyens de mise en evidence 
peuvent etre regroupe en quatre categories principales : 

- les anticorps, 

les liaisons proteine/proteine autre 
qu' anticorps/antigene, 

- les oligonucleotides marques par exemple 
par fluorescence dans le cas ou la proteine recherch£e 
est une proteine se liant a l'ADN, 

les tests d'activite de la proteine, 

quelle qu'elle soit . 

La banque contenant le gene codant pour la 
proteine recherchee peut etre transformer dans des 
bacteries ou des levures, et 1 ' on utilise 1' anticorps, 
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la prot&ine ou 1' oligonucleotide marqu§ pour balayer la 
banque a la recherche de la colonie qui I'exprime. Ces 
syst^mes marchent souvent tr£s mal, car les proteines 
n'ont pas la meme conformation et les memes 
modifications post-traductionnelles chez les bacteries 
ou levures et chez les cellules mammif£res. 

Le probleme de la transfection de banques 
dans les cellules mammif&res reside dans le fait que, a 
la difference des systemes de bacteries ou de levures, 
plusieurs plasmides sont int^gres dans chaque cellule. 
Pour contenir cette difficulty, il est necessaire 
d'utiliser des techniques de f ractionnement successif 
des banques, ou de tris cytof luorimet riques repetes (T. 
Kitamura et.al., PNAS 92 (20) : 9146, 1995 ; D. R. 
Gehlert et al., Molecular Pharmacology, 49 (2) : 224, 
1996) . Chacune de ces deux techniques represente un 
travail important, tr£s long (plusieurs semaines) , qui 
n'est pas tou jours conclusif, et qui n'est pas adapte au 
clonage simultan£ deux inserts ou plus. 

Le procede de 1' invention est beaucoup plus 
simple et moins codteux que tous ceux de l ! art anterieur 
cite ci-dessus. De plus, il peut etre applique au 
clonage simultan£ de plusieurs inserts. Ce dernier point, 
revet une importance majeure lorsqu'on sait que beaucoup 
de prolines de surface sont composees de plusieurs 
chaines et n'atteignent la surface que lorsque toutes 
les chaines sont produites, par exemple dans le cas des 
complexes majeurs d' histocompatibility . Or aucune des 
techniques de I'art anterieur basee sur les banques 
d ! expression ne permet d' avoir accds a ces proteines. 

Un procede de 1' invention pour la 
constitution de banques d' expression comprend les etapes 
suivantes : 

a) On prepare une banque en inserant dans le 
site A du vecteur l'ADN complementaire du tissu ou de la 
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lign£e cellulaire d'interet. La figure 2 en annexe est 
une representation schematique de cette etape. 

b) On.verifie la presence du g£ne recherche 
dans la banque en trans fectant dans une lignee 
cellulaire qui n' a pas l'activite ou le phenotype 
recherche et en mesurant sa restauration, par exemple 
avec un anticorps, de facon a distinguer les cellules 
transfectees ( + ) des cellules non transfectees (-) . La 
figure 4 et 5 en annexe sont une representation 
schematique de cette etape. 

Avantageusement, on utilise des cellules 
COS, classiquement mise en oeuvre pour les 
t rsns f e ct ions . 

c) On digere la banque independamment par 
chacune des 50 & 70 enzymes de restriction disponibles. 
On obtient ainsi 50 a 70 tubes. La figure 6 en annexe 
est une representation schematique de cette etape. 

d) On transfecte independamment les 50 a 70 
banques mono-diger£es, et tester la presence de 
l'activite recherchee dans chacun de ces 50 a 70 lots de 
cellules transfectees. La figure 7 en annexe est une 
representation schematique de cette etape. 

e) On etablit ainsi la CEM de l'activite 
recherchee. Si la digestion par 1' enzyme I n'alt£re pas 
l'activite de 1' insert present dans la banque, on notera 
I r . Si elle l'altere, on notera I s . 

On obtient, dans 1' exemple de la figure 7 en 

s r r 
annexe, la CEM suivante: I II . . .LXX . 

En moyenne, on estime que 55 + 4 enzymes sur 

70 auront un r, et 15±4 auront un s pour un insert de 1 

kb. En effet, la probabilite de clivage par une enzyme 

de restriction a site hexanuclueot idique, a une position 

donnee prise au hasard, est p = 1/4 6 = 1/4096. Sur un 

g£ne dont la taille est n nucleotides, la probabilite 

theorique d'avoir 1, 2, 3, ... clivages suit une loi 

binomiale de probabilite p et de nombre d f evenements n. 



WO 99/28451 



21 



PCT/FR98/02629 



La probability de n' avoir aucun clivage est C n °P n (l-p)°. 
Dans le cas ou n = 1000, on obtient une probability de 
78,3%. La probability d' avoir un clivage ou plus est 
d 1 environ 21,7 %. Le nombre moyen d' enzymes ne clivant 
pas est done de 0,7 83 x 70 = 55, et 1'ecart type est 
proche de 4 . 

f) On reprend la banque totale et on la 
dig£re sensiblement simultanement par les 55 enzymes qui 
n'affectent pas 1' activity mesuree qui est associee & 
"r" pour 1' insert recherche. La figure 8 en annexe est 
une representation schematique de cette etape. 

En pratique, cette digestion ne peut etre 
totalement simultanee pour des raisons de compatibility 
de tampons, et l'on est oblige de 2 ou 3 multi- 
digestions successives correspondant aux deux ou trois 

tampons choisis. 

La probability pour un insert pris au hasard 
d'etre clive par x de ces 55 enzymes suit aussi une loi 
binomiale, de probability 0,783 et de nombre 
d'evenements 55. La probability pour un insert de n'etre 
clive par aucune des 55 enzymes est done C55 0 x 
(0, 783)^5 x (1 - 0,783)0 = (0,783)55 = 1,4.10-6. 

II ne reste done, en moyenne, que 1' insert 
recherche, plus 1,4.10~ 6 x 10 5 = 0,14 insert parasite. 

L' utilisation partielle de la CEM, 
correspondant uniquement aux enzymes associees a un r, 
est suffisante pour isoler le gene recherche, lequel est 
deja pur £ plus de 85%. 

g) On transforme la banque multi-digeree 
dans des bacteries compytentes. Avantageusement on etale 
sur petri et 1 1 on verifie par miniprep que les inserts 
sont bien sensibles aux enzymes notees "s" lors de 
l'etablissement de la CEM. La figure 9 en annexe est une 
representation schematique de cette etape. 
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h) On sous-clone en utilisant 1' enzyme B 
dans un vecteur d' etude, tel que Bluescript. Puis 
avantageusement on sequence. 

5 Le modele decrit a l'etape (e) ci-dessus est 

conforme & la realite, mais ne represente qu'une 
moyenne. En effet, la probability de clivage varie d'une 
enzyme de type site hexanucleotidique ct une autre. 

10 Chacune de ces 8 etapes ne demande que tres 

peu de temps, puisque le procede ci-dessus devrait peut 
etre realise en 16 jours dont 10 de travail. 

Le procede de 1' invention permet notamment 
15 de generer des banques d' expression pour de nombreux 

tissus et lignees, puis en faire les 50 a 70 simples 
digestions, les transfecter, faire l'extrait cellulaire 
de ces cellules transf ectees, et les deposer sur une 
membrane comme represente a la figure 10. 
20 II ne reste alors plus qu'ci reveler la 

membrane par exemple avec un anticorps selon la 
technique dite de Western blot, afin d'obtenir 
immediatement la CEM de 1' insert recherche comme 
represente sur la figure 11. La banque est alors multi- 
25 digeree en fonction de la CEM obtenue, puis on 

transforme des bacteries competentes avec ce produit 
multi-digere, et le gene est clone en 3 jours au lieu de 
plusieurs mois par les techniques de 1 1 art anterieur. 

On peut conserver ces membranes ad vitam 
30 aeternam a 4°C ou congelees. 

L'exemple ci-dessus est base sur 
l'utilisation d'un anticorps specifique mais d'autres 
systemes de revelation du phenotype associe a la CEM 
peuvent etre utilises, comme un test enzymatique. 
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Rxem ple 2 : Le clonaae par homologie. 
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Le clonage par homologie est intensivement 
utilise par de tr£s nombreux laboratoires de biologie 
moleculaire pour 1 1 identification : 

a) d' alleles de differentes souches 
d' animaux de la meme esp£ce, ou de differents individus 
chez l'homme (souvent tr^s homologues) . 

b) d' Equivalents gEniques presents chez 
differentes esp^ces (moderement homologues) . 

c) d'epissages alternatifs d'un m§me gene au 
sein d'un meme tissu ou entre differents tissus 
(homologie totale par sections) . 

d) de differents membres d' une famille 
genique, distribute au sein d'un meme tissus ou dans 
differents tissus. (homologie imprevisible, souvent tres 
forte dans certains domaines) . 

Les strategies utilises dans l'art 
anterieur sont essentiellement les deux suivantes (M. 
Parmentier et al., Nature, 355 : 453, 1992) : 

- La PCR par homologie et ses derives, 
lesquels soulevent le probleme du choix des amorces 
alors que l'on ne connait pas les parties conservees. La 
fenetre entre le bruit de fond aspecifique et les vraies 
amplifications homologues est ttroite. De plus, la 
partie amplifiee ne represente le plus souvent pas tout 
le g£ne et on est alors oblige d'aller chercher les 
morceaux manquants, et notamment la partie en 5' , par 
des techniques laborieuses comme la PCR ancree . 

L' hybridation de banques existant 
actuellement . Cette methode est efficace, mais necessite 
beaucoup de travail. En outre, elle ne s' applique qu'a 
1 1 identification d*all61es (a) ou d ' equivalent s geniques 
(b) . Pour 1 ' identification des epissages alternatifs (c) 
ou des differents membres d'une famille g6nique (d) , on 
redone toujours l'ADNc majoritaire, done dans la 
plupart des cas, le gene dont on dispose deja. 
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Le procede de 1 ! invention permet une fois 
qu'on a clonS un g&ne, de produire une sonde qui 
s'hybride sur des g£nes homologues. On utilise done 
cette sonde pour pecher ses homologues par hybridation k 
faible stringence. 

Le procede de clonage par homologie selon 
l f invention comprend les etapes suivantes : 

a) On prepare une banque d'ADNc comme decrit 
ci 1' etape (a) de I'exemple 1. 

b) On digere la banque independamment par 
chacune des 70 enzymes de restriction comme comme decrit 
a l 1 etape (c) de I'exemple 1, 

c) On transforme ces 50 a 70 digestions dans 
des bacteries competentes. La figure 12 en annexe est 
une representation schematique de cette etape. 

d) On fait pousser les bacteries 
transformers en milieu selectif, de fagon a produire des 
grandes quantites des banques digerees debarrassees des 
produits clives (non transf ormants en raison de leur 
linearisation) . Les elements clives sont desormais 
absents des banques. La figure 13 en annexe est une 
representation schematique de cette etape. 

e) On clive separSment chacune de ces 
banques par 1' enzyme B. La figure 14 en annexe est une 
representation schematique de cette etape. 

On depose alors separement chacun de ces 50 
a 70 produits de digestion dans un puits de gel 
d' agarose, comme represents a la figure 15 en annexe. 

Puis, on fait migrer, 1 ' on transf ere sur 
nitro-cellulose, et 1 1 on hybride avec la sonde, comme 
represents a la figure 16 en annexe. 

f) On analyse la CEM du signal. Ainsi, si 
une bande est presente dans la piste "banque non 
digeree", mais absente dans la piste "banque digeree par 
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I", c'est que 1' insert hybride est sensible a 1' enzyme 
I, et ainsi de suite. 

g) on fait les multi-digestions 

correspondantes, et le seul plasmide resistant est le 

5 plasmide recherche. Avantageusement , on peut ensuite 

faire des minipreps avec ce plasmide en utilisant les 
enzymes "s" pour confirmer. 

Ce precede peut §tre utilise 

10 industriellement, en proposant les Blots correspondant a 

de nombreuses banques, comme celles realisees dans 
l 1 exemple 1. Ainsi , en disposant de la sonde et des 
Blots judicieusement choisis, il devient quasi imm6diat 
de trouver tous les alleles, correspondants d'esp£ce, 

15 epissages alternatifs et isotypes (deux jours de 

travail, sans compter le sequengage) . 

Une version simplifiee de ce proc£d& 
consiste a effectuer des Dots au lieu de Blots, e'est-a- 
dire a s'abstenir de cliver les banques mono-digerees 

20 par 1' enzyme B, et a les deposer direct ement en un point 

sur une membrane de nitro-cellulose . Lors de 
1' hybridation avec la sonde, les points g£nerant un 
signal, par exemple radioactif, correspondraient aux 
enzymes pour lesquelles le plasmide serait resistant. 

25 Ceux ne retenant plus de signal correspondraient aux 

enzymes pour lesquelles 1' insert est sensible. L' analyse 
est alors proche de celle developpee dans 1' exemple 1, 
comme representee aux figures 17 et 18 en annexe. 

30 Cette version simplifiee est cependant 

insuffisante pour doner des isotypes ou des epissages 
alternatifs exprim^s dans une meme cellule. 



Rypmple 3 I Sou thern Blot d' ident i f j cat ipn 
35 "identiblot". 



WO 99/28451 



26 



PCT/FR98/02629 



Les applications precedentes du proctdt de 
1" invention visent a simplifier et rendre plus rapide le 
clonage par expression ou par homologie et en offrant de 
nouvelles possibilities . 

Le Southern Blot d' identification propose un 
raccourci qui faciliterait les travaux du chercheur 
impliqut dans les techniques de clonage moleculaire . 

En effet, Le cas est frequent dans l'art 
anterieur ou une strategie de clonage aboutit a 
l'obtention de nombreux inserts, parmi lesquels se 
trouve le gtne recherche et de nombreux parasites. Or 
dans I'art anterieur, pour identifier un insert parmi 
tous ces parasites, il est est indispensable de le 
sequencer, au moins partiellement , ce qui represente un 
travail considerable. Le stquengage est une technique 
fastidieuse et trop puissante pour ce simple usage 
d' identification d' inserts, en effet la lecture de 10 
nucleotides suffit le plus souvent a identifier un 
insert. Un technique moins puissante, mais moins 
fastidieuse, utilisant la DMD, pourrait lui etre 
substitute . 

Ainsi, comme decrit precedemment, il est 
possible de faire des Southern Blots de banques d'ADN 
genomique de fagon industrielle . Une representation 
schtmatique de la preparation d'une telle banque d 1 ADN 
genomique est donnee a la figure 3 en annexe. Ce 
Southern Blot, rebaptise "identiblot" dans le cadre de 
la presente invention est suffisamment informatif pour 
permettre 1' identification du fragment d'ADN homologue 
de la sonde. 

Ce southern blot est meme cent millions de 
fois trop informatif. En effet, la banque genomique est 
constitute de 4 millions d' inserts differents de 1 kb de 
long. Pour les memes raison que celles exposees 
precedemment, un insert pris au hasard sera resistant S 
55 enzymes sur 70 et sensible a 15. Le nombre de 
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combinaison enzymatique possible est done C70 15 , soit 
70!/ (55115!) = 7,2.10 14 . Ce nombre est plus de cent 
millions de fois superieur A la taille de la banque. Le 
fait de consid^rer que les inserts ont tous une taille 
differente ajoute encore des possibility . Chaque insert 
de la banque est done assocife a une CEM originale. 

Ce proc6d6 presente un int£ret majeur dans 
le cas de strategies de clonages aboutissant a de forts 
taux de clones faux positifs, par exemple dans les cas 
de 1' utilisation de banques soustractives . ou de 
strategies de clonage par insertion. 

En effet, £ partir des cinquante clones 
6tudi£s, il suffit de preparer une "sonde multiplex" , 
e'est a dire un marquage commun de cinquante inserts 
(dans un seul tube), et une seule hybridation du filtre 
de nitro-cellulose . On obtient 1' identity des cinquante 
inserts d' un seul coup, en comparant leurs CEM avec 
celles prealablement entries dans une base de donnees 
informatique . 

La figure 19 en annexe represent e un exemple 
ou trois sondes A, B, et C ont ete utilisees 
simultanement . Les inserts genomiques correspondant a 
des CEM non decrites, et eux seuls, seront clon^es par 
exemple par multi-digestion, puis sequences. 

A 1' inverse du cas des banques d'ADNc, dont 
la variete est insondable, il est suffisant de produire 
un seul type de Blot, pour chacune des 10 especes 
etudiees couramment en biologie : humain, souris, rat, 
drosophile, tabac, levure, etc... 

Exemple 4 : Etude du polymorphi sme humain. 

Les travaux de recherche menes dans le cadre 
de l'etude du polymorphisme necessitent 1 1 utilisation 
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d'un nombre croissant de marqueurs gen£tiques. Leur 
utilisation dans le cadre du diagnostic des maladies 
g£n£tiques est £galement en forte augmentation. II est 
probable que dans un futur proche des cartes 
personnelles de predisposition genetique pourront etre 
§tablies, de fagon ci ce que chacun 6vite de s'exposer & 
certains risques environnementaux, comme le tabac en cas 
de predisposition au cancer du poumon, le sucre pour les 
terrains diab6tiques, etc. . . . 

Les techniques disponibles dans l'art 
ant6rieur permettant d' etudier le polymorphisme sur un 
allele sont principalement la PCR, le Southern Blot et 
1' etude des marqueurs de l'ADN satellite 
(potentiellement utilises en combinaison) . La methode de 
1' invention constitue done une alternative, plus 
efficaces, a ces techniques. 

La mise en oeuvre du procede de clonage 
selon l f invention pour 1 1 etude du polymorphisme humain 
est proche de celle de l'exemple 3 ci-dessus. La 
difference majeure reside dans le fait qu' il est 
necessaire de realiser la banque, ses digestions, la 
migration sur gel et le transfert sur membrane, pour 
chaque sujet. 

Ce procede permet egalement de localiser 
tr&s rapidement 1'origine d' une maladie genetique par 
1' analyse des diff£rents membres de la famille hebergeant 
la pathologie. Dans une famille dite "a risque" pour une 
pathologie, il convient de faire les Identiblots 
correspondant aux differents membres de la famille, et de 
les tester au moyen de polysondes faites a partir des 
marqueurs gen£tiques deja existants. En un jour, on peut 
hybrider au moins vingt membranes, soit obtenir 1' allele 
de 1000 marqueurs. Les facteurs genetiques multiples 
pourraient etre definis avec cette technique. 

Cette application du procede de 1' invention 
implique un investissement en temps de l'ordre de 
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plusieurs heures de travail, mais est rapidement 
rentabilist par la possibility de tester les marqueurs 
de predisposition genetique 50 par 50, au moyen de 
sondes multiplex preparees en routine et constitutes du 
nombre equivalent de marqueurs. 

Rypm plft 5 : Deuxifeme approche de 1 ' ttude du 
polymorp hic humain selon 1' invention, 

Cette seconde mise en oeuvre du proctde de 
1' invention a 1' etude du polymorphisme concerne 
1" application de la DMD a 1' etude des marqueurs 
genetiques par RFLP . Le procede selon 1' invention 
comprend alors les Stapes suivantes : 

a) On a prealablement definis la CEM de 
chacun des marqueurs connus de fagon a permettre leur 
identification. Cette identification est faite une fois 
pour toutes et un polymorphisme est done caracterise par 
une variation de la CEM. 

b) On constitue une banque d'ADN gtnomique 
du sujet ttudie dans le vecteur precedemment decrit. 
Comme indique precedemment, il peut etre avantageux que 
les vecteurs seuls ligues sur eux-m§mes soient elimines. 
Avantageusement, on prepare une banque dont les 
fragments ont une longueur moyenne de 2000 nucleotides. 

c) On effectue la digestion de la banque par 
des batteries d' enzymes correspondant aux CEM attributes 
aux marqueurs etudies. 

Ainsi, par exemple, dans le premier puits, 
on met les cinquante enzymes qui vont digerer toute la 
banque sauf un premier marqueur . Dans le second puits, 
on met une autre batterie d' enzymes pour un second 

marqueur, etc. . . 

d) On transforme les banques multidigerees 

dans des bacteries competentes. 
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e) On cultive en milieu solide (boite de 
petri) contenant 1' agent s&lectif du plasmide de fagon d 
ce que si 1' allele recherche existe, les bacteries 
poussent. Par contre, si cet allele n'existe pas, elles 

5 ne poussent pas. On dispose ainsi d'un profil pour 

chaque allele, et l ! on peut etudier un nombre illimite 
de marqueurs en une seule fois. 

Ce procede peut etre automatism en preparant 
des plaques de 96 puits contenant tous les melanges 

10 enzymatiques, ces plaques sont stockees en congelateur. 

Differents types de plaques pourraient etre produites: 

- Marqueurs repartis sur tout le genome. 

- Marqueurs repartis sur un seul chromosome. 

- Marqueurs repartis sur une region precise. 
15 - Marqueurs relies aux risques de 

pathologies . 

- Etc. . . 

On distribue dans chaque puits une quantity 
fixe d'ADN sous forme de banque, puis l'on incube k 37 °C 
20 pour les digestions. On rajoute alors les bacteries 

comp£tentes, et on suit le m£canisme classique de 
transformation (choc thermique, incubation sans agent de 
selection, etc...). On prel£ve a la pipette 96 canaux et 
l'on depose sur un petri. La lecture est effectuee a 
25 l'oeil ou & l'aide d'un spectrophotometre . 

Cette seconde approche off re l'avantage 
d f etre facilement automatisable, et confere a grande 
echelle un gain de temps tres important. En effet, il 
faut tester un grand nombre de marqueurs pour chaque 
30 individu, car la creation de la banque represente un 

investissement en travail. En outre, elle permet de 
s'exonerer de toute radioact ivite, couteuse et nocive. 
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Rxem ple 6 : Troisieme approche de 1 ' etude du 
polvmorphisme humain selon l 1 i nvention. 
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Cette variante du proc6de d'6tude du 
polymorphisme humain selon 1' invention se rapporte £ 
l 1 application de la DMD & 1' etude des differents alleles 
d'un seul marqueur. 

Dans l'art anterieur, ces differentiations 
se font essentiellement pair s^quengage. Dans un futur 
proche, les puces d'ADN (T. Pastinen et al. f Genome 
Research 7 : 606-14, 1997 ; J. G. Hacia et al . , Nature 
Genetics, 14 : 441, 1996), permettront d 1 automatiser ces 
travaux. Ceux-ci sont particulierement utiles dans le 
cas de l'examen de la gpl20 du virus HIV ou d' oncogenes 
cellulaires tels p53, presents sous de nombreux alleles. 

Conformement k la presente invention, cette 
variante consiste k prealablement definir la CEM de 
chacun des alleles du segment etudie. Cette 
identification est realisee une fois pour toute et se 
limite aux alleles comportant au moins un site de 
restriction de difference. Puis on amplifie par PCR le 
fragment Etudie. On clone ledit fragment dans le vecteur 
de 1' invention. Ce procede est done tres proche de celui 
de l'exemple 5, mais avec une banque comportant 
seulement un ou deux inserts correspondant aux deux 
copies du gene present chez un individu. La suite de ce 
procede est identique & celle de l'exemple 5. 

Ce travail peut etre realise simultanement 
sur plusieurs inserts a la fois. 
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R E VEND I C AT I QN S 

1) Procede de clonage d'un fragment d'acide 
nucleique, caracterise en ce qu'il comprend les etape 

5 suivantes : 

- on prepare une banque d 1 ADN susceptible de 
contenir ledit fragment d'acide nucleique a doner, 

- on crible ladite banque en utilisant de 
fagon combinatoire au moins 10 et de preference 50 & 70 

10 enzymes de restriction, pour isoler par tout moyen 

appropri£ le clone contenant ledit fragment. 

2) Procede selon la revendication 1, 
caracteris£ en ce que la preparation de la banque d'ADN 

15 susceptible de contenir le fragment d'acide nucleique £ 

doner, consiste a insurer chacun des fragments d 1 ADN 
d'un 6chantillon dans un vecteur substantiellement 
d£pourvu de tout site de clivage par des enzymes de 
restriction mais conservant : 

20 - un ou deux sites pour la construction de 

la banque, et 

- 6ventuellement au moins deux autres sites, 
et de preference seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 

25 -flanquant, utiles pour sous-cloner le fragment d'acide 

nucleique une fois celui-ci identify et clone. 

3) Procede de clonage d'un fragment d'acide 
nucleique selon l ! une des revendications 1 a 2, 

30 caracterise en ce qu'il comprend les etape suivantes : 

(a) on prepare une banque d 1 ADN susceptible 
de contenir le fragment d'acide nucleique, consistant a 
inserer chacun des fragments d 1 ADN d'un echantillon dans 
un vecteur substantiellement depourvu de tout site de 

35 clivage par des enzymes de restriction mais conservant : 
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- un ou deux sites pour la construction de 

la banque, et 

- Eventuellement au moins deux autres sites, 
et de pr6f£rence seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flanquant, utiles pour sous-cloner le fragment d'acide 
nucleique une fois celui-ci identifie et clone. 

(b) On realise la digestion en parallele de 
la banque par plusieurs enzymes de restriction, au moins 
10 et de preference environ 50 a 70 enzymes de 
restriction de fagon obtenir autant de banques mono- 
dig6r§s que d 1 enzymes utilis6es. 

(c) On transfecte independamment les banques 
mono-diger£es dans des hotes ceiluiaires appropries de 
fagon a obtenir des lots correspondant d' hotes 
ceiluiaires . 

(d) On teste par tout moyen approprie chacun 
des lots obtenus a l'etape (c) pour evaluer 1 1 integrite 
du fragment d'acide nucleique a doner et ainsi etablir 
sa CEM. 

4) ProcEde selon la revendication 3, 
caract6rise en ce qu'il comprend les etapes suivantes : 

(e) On reprend la banque totale de l ? etape 
(a) et on la dig^re sensiblement simultanement par les 
enzymes qui n f affectent pas 1 ' integrite du fragment 
d'acide nucleique a doner. 

(f) On isole le clone resistant contenant le 
fragment d'acide nucleique a doner par tout moyen 
approprie et eventuellement on le sous-clone en 
utilisant les deux sites menages dans le vecteur a cet 
effet . 

(g) On sequence eventuellement le fragment 
d'acide nucleique clone. 
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5) Proc£de selon les revendications 3 ou 4, 
caract£ris& en ce qu'il comprend entre les 6tape (a) et 
(b) l'etape suivante : 

(a 1 ) on v6rifie la presence du fragment 
d'acide nucleique a doner dans la banque en 
transfectant dans un hote cellulaire qui n'a pas ledit 
fragment et en testant par tout moyen approprie la 
presence du fragment dans ledit hote. 

6) Procede selon les revendications 4 et 5, 
caract£ris6 en ce qu'il comprend entre les etape (e) et 
(f) l'etape suivante : 

(e') On transforme la banque multi-digeree 
de l'&tape (e) dans des hotes competent s, de fagon a 
verifier la nature des fragments clones. 

7) Procede selon 1 ' une quelconque des 
revendications 1 a 6, caracterise - en ce la banque d'ADN 
contient de 1 £ 10 8 et de preference de 1 1 ordre de 10 5 a 
4.10 6 fragments differents de 1' ordre de 0,1 kb a 5 kb 
chacun, et de preference de 1 1 ordre de 1 a 2 kb. 

8) Procede selon l'une quelconque des 
revendications 3 a 7, caracterise en ce que les tests 
realises aux etapes (d) et/ou (a 1 ) pour verifier 
l'integrite de la sequence d'acide nucleique a doner 
sont tout moyen de mise en evidence soit de la sequence 
elle-meme, comme une sonde, soit de la proteine codee 
par ladite sequence, tel qu'un ligand comme un 
anticorps, ou encore de l'activite de cette proteine, 
comme un marqueur enzymatique, qui peuvent etre 
detectees par tout moyen connu de l'homme du metier, 
comme un marquage fluorescent ou radioactif. 

9) Procede de clonage d'un gene par banque 
d'expression selon l f une quelconque des revendications 1 
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k 7, caract6ris£ en ce qu'il comprend les 6tapes 
suivantes : 

a) On prepare une banque d'ADNc susceptible 
de contenir ledit g£ne en insurant dans un vecteur 
substantiellement d&pourvu de tout site de clivage par 
des enzymes de restriction mais conservant : 

- un ou deux sites pour la construction de 

la banque , et 

- eventuellement au moins deux autres sites, 
et de preference seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flanquant, utiles pour sous-cloner le gene une fois 
celui-ci identifie et clon£. 

b) On verifie la presence du gene recherche 
dans la banque en transfectant dans une lign£e 
cellulaire qui n'a pas l'activite ou le phenotype 
recherche et en mesurant sa restauration de facon a 
distinguer les cellules transfectees des cellules non 

transfectees . 

c) On digere la banque independamment par au 
moins 10 et de preference environ 50 a 70 enzymes de 
restriction . 

d) On transfecte independamment les banques 
mono-digerees de l'etape (c) . 

e) On teste par tout moyen approprie chacun 
des lots obtenus a I'fetape (d) pour la presence de 
l'activite associee au gene a doner et on evalue 
l'integrite de la sequence dudit g£ne afin d'etablir la 
CEM de l'activite associee audit gene. 

f) On reprend la banque totale de l f etape 
(a) et on la digere sensiblement simultanement par les 
environ 50 & 55 enzymes qui n'affectent pas l'activite 

mesuree a 1 '6tape (e) . 

g) On transforme la banque mult i-digeree 

dans des bacteries competentes. 
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h) On sous-clone en utilisant 1' enzyme 
corresponciant au site de sous-clonage menag&s dans le 
vecteur, puis eventuellement on sequence le gene. 

10) Proc§de de clonage par homologie selon 
l'une quelconque des revendications 1 a 9, caract£ris6 
en ce qu'il comprend les etapes suivantes : 

(a) on prepare une banque d'ADN susceptible 
de contenir ledit fragment d'acide nucleique, consistant 
k inserer chacun des fragments d'ADN d'un echantillon 
dans un vecteur substantiellement depourvu de tout site 
de clivage par des enzymes de restriction mais 
conservant : 

- un ou deux sites pour la construction de 

la banque, et 

- eventuellement au moins deux autres sites, 
et de preference seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flanquant, utiles pour sous-cloner le fragment d'acide 
nucleique une fois celui-ci identifie et clone. 

b) On digere la banque independamment par 
chacune d'au moins 10 et de preference environ 50 a 70 
enzymes de restriction. 

c) On transforme les produits de la 
digestion de l'6tape <b) dans des bacteries competentes . 

d) On fait pousser les bacteries 
transformees en milieu selectif, de fagon a produire des 
grandes quantites des banques digerees debarrassees des 

produits clives. 

e) Eventuellement on clive separement 
chacune de ces banques par 1' enzyme correspondant au 
site de sous-clonage menage dans le vecteur et 1 1 on 
depose separement chacun des produits de digestion dans 
un puits de gel d' agarose. 

f) f) on fait migrer les produits de 
digestion de l'etape (e) , puis l'on transfere sur 
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membrane par exemple de nitro-cellulose, et l'on hybride 
avec une sonde sp6cifique du g£ne & doner par 
homologie, ou bien l ! on depose directement les produits 
de l'6tape (d) sur une membrane de nitrocellulose. 

g) On analyse la CEM du signal. 

e) On fait les multi-digestions 
correspondantes, de fagon a ce que le seul vecteur 
resistant soit le vecteur portant le gene A doner. 

11) Application du procede selon la 
revendication 10 ci 1 1 identification : 

- d' alleles de differentes souches d' animaux 
de la meme esp£ce, ou de differents individus chez 
1' homme, 

d' equivalents g&niques presents chez 

differentes especes, 

- des epissages alternatifs d' un gene. 

de differents membres d'une famille 

genique . 

12) Procede de Southern Blot 
d' identification d' inserts mettant en oeuvre un procede 
de clonage d ! une sequence d'acide nucleique selon l'une 
quelconque des revendications 1 a 10, caracterise en ce 
qu ! il comprend les etapes suivantes : 

(a) on prepare une banque d'ADN susceptible 
de contenir ledit insert, consistant a inserer chacun 
des fragments d'ADN d f un echantillon dans un vecteur 
substantiellement depourvu de tout site de clivage par 
des enzymes de restriction mais conservant : 

- un ou deux sites pour la construction de 

la banque, et 

- eventuellement au moins deux autres sites, 
et de preference seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 



WO 99/28451 



38 



PCT/FR98/02629 



flanquant, utiles pour sous-cloner 1 ' insert une fois 
celui-ci identifi6 et clon6. 

b) On digere cette banque par chacune d'au 
moins 10 et de preference environ 50 a 70 enzymes de 
restriction. 

c) On transforme les banques monodig6r£s 
obtenues a l'etape (b) ci-dessus dans des bact^ries 
comp&tentes, ou des hdtes equivalents. 

d) On fait pousser les bact6ries en milieu 
selectif, de fagon k produire des banques diger&es 
d&barassees des produits clives. 

e) On clive s£parement chacune de ces 
banques par la ou les enzymes correspondant au(x) 
site(s) de sous-clonage flanquant le ou les sites de 
construction de la banque, et on depose les produits de 
digestion dans les puits d"un gel d' agarose ou 

d ! acrylamide . 

f) On fait migrer ce gel et on le transf&re 
sur une membrane par exemple de nitrocellulose. 

g) On utilise les inserts a identifier comme 
sondes marquees, soit un par un, soit plusieurs par 
plusieurs . 

h) On teste par tout moyen approprie chacun 
des lots obtenus a l'etape (g) pour les associer a une 
CEM. 

13) Procede d f £tude du polymorphisme mettant 
en oeuvre un procede de Southern Blot d' identification 
d' inserts selon la revendication 12, caracterise en ce 
que : 

- La banque d'ADN genomique de l'etape (a) 
est issue du sujet etudie. 

- Les inserts utilises comme sondes sont des 
marqueurs de polymorphisme. 
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14) Proc6d§ d' etude du polymorphisme 
caract£ris6 en ce qu'il comprend les etapes suivantes : 

a) On definit la CEM de chacun des marqueurs 
connus de fagon & permettre leur identification par le 
proc6d& de clonage selon la revendication 3. 

b) On const itue une banque d'ADN genomique 
du sujet 6tudie consistant £ inserer chacun des 
fragments d'ADN d'un £chantillon dans un vecteur 
substantiellement dtpourvu de tout site de clivage par 
des enzymes de restriction mais conservant : 

- un ou deux sites pour la construction de 
la banque, et 

- eventuellement au moins deux autres sites, 
et de preference seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flanquant, utiles pour sous-cloner 1 ' insert une fois 
celui-ci identifie et clone. 

c) On effectue la digestion de la banque par 
des batteries d' enzymes correspondant aux CEM attributes 
aux marqueurs 6tudi6s. 

d) On transforme les banques multidigerees 
dans des bacteries competentes. 

e) On cultive ces bacteries en milieu 
liquide ou solide contenant 1' agent selectif du 
plasmide. Si 1' allele recherche existe, les bacteries 
poussent, par contre, si cet allele n' existe pas, elles 
ne poussent pas, et l'on dispose ainsi d'un profil pour 
chaque allele. 

15) Melange d'au moins 10 et de preference 
de 50 a 70 enzymes de restriction susceptible d'etre 
utilise dans un procede selon 1 ' une quelconque des 
revendications 1 a 14. 
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16) Utilisation d'un vecteur 

substantiellement d6pourvu de tout site de clivage par 
des enzymes de restriction mais conservant : 

- un ou deux sites pour la construction 

d'une banque, et 

- eventuellement au moins deux autres sites, 
et de preference seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flanquant, utiles pour sous-cloner des fragments dans 

ladite banque, 

pour cribler une banque d'ADN. 

17) Une banque d ! acide nucleique clonee dans 
un vecteur susceptible d'§tre preparee dans un procede 
selon l ! une quelconque des revendications 1 a 14, 
caract^rise en ce que ledit vecteur est 
substantiellement depourvu de tout site de clivage par 
des enzymes de restriction mais conservant : 

- un ou deux sites pour la construction de 

la banque, et 

- eventuellement au moins deux autres sites, 
et de preference seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flanquant, utiles pour sous-cloner les fragments de la 
banque . 

18) Une banque selon la revendication 16, 
caract^risee en ce que le vecteur porte un systeme qui 
^limine tout vecteur seul referme sur lui-meme. 

19) Une banque d'ADN selon 1 1 une des 
revendications 16 ou 17, caracterisee en ce qu'elle est 
multi-digeree par un melange d' enzymes selon la 
revendication 15. 



WO 99/28451 



41 



PCT/FR98/02629 



20) Un groupe de banques d'ADN selon l ! une 
des revendications 16 ou 17, caracteris£e en ce qu'elle 
est mono-digeree independamment par chacune des enzyme 
du melange d' enzymes selon la revendication 15. 

21) Les hotes cellulaires ou bacteriens 
contenant une banque ou un groupe de banques selon l'une 
des revendications 19 ou 20. 

22) Support port ant une banque ou un groupe 
de banques selon l'une des revendications 19 ou 20 ou 
des hotes cellulaires selon la revendication 21. 
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